馬上註冊  |  找回密碼

SAY討論區

查看: 821|回復: 0
打印 上一主題 下一主題

Radeon HD 7000系列(一)Northern Islands族系簡介(上) [複製鏈接]

Rank: 7Rank: 7Rank: 7

好友
0
帖子
140
積分
2287
最後登錄
2012-2-28
在線時間
0 小時
跳轉到指定樓層
樓主
發表於 2012-2-23 15:34:08 |只看該作者 |倒序瀏覽
Radeon HD 5000 Evergreen長青木,Radeon HD 6000 Northern Islands(加勒比海)北方群島,不經不覺ATi已推出了六代具備高清能力的顯示晶片。2012年,Radeon昂然踏入HD 7000族系,AMD(ATi)較早前公布四個開發代號的名稱。這四個名都是地名,分別位於澳洲以東,南太平洋的島嶼,因此合稱為「Southern Islands」南方群島。四個名分別是Tahiti大溪地(高階)、Pitcairn皮肯特島(進階)、Cape Verde維德角(主流)及雙GPU的New Zealand紐西蘭,佔用型號名稱由7900至7700。至於更低階的7500/7600、7400及7350便分別由6000系列的Turks,Caicos及5000系列的Cedar PRO易名而來。由此可見,整個7000系列產品以7700為分水嶺,新產品集中在較高階的型號中(請參看附圖)。整體來說,四個新代號的產品除主介面由PCI Express 2.1改為PCI Express 3.0,速度由16GB/s上升一倍至32GB/s;支援DirectX 11.1及改用TSMC最新28mm high-K metal gate(TSMC的CLN28HP(HKMG))製程之外,在Front-End,運算架構,多媒體播放及輸出連接各部分都得到明顯的強化。
◆ 新產品採用最新28nm製程生產
◆ 三個新代號定位不同
◆ AMD 2012年顯示晶片的Roadmap

GCN Front-End結構更緊密
先講講Front-End部分,其設計與上一代Radeon HD 6900 Cayman並不相同。Cayman的主要為分兩個Graphics Engine,每個Engine各有相同的部件。而Southern Islands Tahiti的Front-End部件經過重新編排,而且更為緊密:兩個ACE(Asynchronous Compute Engine),兩個Geometry Engine(內有Geometry、Vertex Assembler各一及一個第九代Tessellator密鋪平面器)和兩個Rasterizer(內有Scan Converter和Hierarchical-Z各一)。結構當中重點是第九代Tessellator,AMD聲稱其效能可達第八代的4倍,連同第八代Tesellator的效能是第七代(6870 Barts)的兩倍,Southern Islands產品的密鋪平面能力最高是Northern Islands的七至八倍。如果屬實,實際效果將會十分明顯。
◆ Southern Islands的Front-End設計與Northern Islands的不同
◆ Front-End的結構重新整理(網上圖片)
◆ Tessellator的效能一再提升

GCN結構更緊密
Southern Islands最主要的改變是轉用了GCN(Graphics Core Next)的運算架構,此架構早應用於Llano APU。負責運算的部件稱為「Graphics Core Next Compute Unit」,簡稱「Compute Unit」。設計者設計新引擎的出發點是需要一個「Scalable Multi-Task」的圖像引擎,注重擴充性(Scalability)及靈活性(Flexibility),於是放棄Evergreen及Northern Islands沿用的VLIW(VLIW5及VLIW4)運算模式,改用傳統x86 ISA的Scalar及Vector運算模式,這亦是新引擎的核心。每個GCN Compute Unit內大可以分為六個部分:1. Branch and Message Unit;2. Scheduler;3. Scalar Unit連Register;4. Vector Unit連Register;5. Texture部件及6. CU Data L1 Cache。Branch and Message Unit專負處理Branch程序及輸出信息(包括Debug或同步信息);雖然在上一代Cayman的TeraScale 3架構中,將Ultra-Threaded Dispatch Processor的數量增加一倍至兩個,而在Tahiti的GCN架構中,每個GCN各有一個Scheduler,即Scheduler數量與所開動的Compute Unit數量掛鈎。以效能最高的Tahiti XT為例,Scheduler數量與GCN Compute Unit數量一樣共有32個。根據APU的GCN架構,這個Scheduler應該包括以下幾個部分:Instruction Fetch Arbitrator,4個SIMD PC(Program Counter)& IB(Instruction Buffer),Intruction Arbitrator和4個Decoder(Export/GDS Decode,LDS Decode,Scalar Decode和Vector Decode)。即是指令經過Prefetch預取及Decode解碼後,便會按屬性泵入不同的地方進行暫存或處理。

GCN運算部件是x86 ISA設計
Compute Unit內的Scalar Unit及Vector Unit就是負責運算的核心。Scalar Unit內有一個ALU,配以4KB Register(APU時發表的GCN卻是8KB),負責處理32/64bit Scalar整數運算;Vector Unit採用新型的「SIMD-16」,配以64KB Register。SIMD-16是Multi-Precision(MP,多精度)設計,每個時脈可同時處理16個32bit單精度(Single Precision)IEEE浮點(IEEE 754-2008)或32bit整數運算。根據官方資料,如果將GCN Compute Unit(4x SIMD-16)與TeraScale 3引擎的SIMD引擎(16x VLIW4)比較,大家同是64 Single Precision MAC(multiply-accumulate)運算,前者只需要標準的編寫器及優化方法,較容易Debug和分析,開發的時間及成本也較少,而且效果較能預料,更有利於軟件商開發複雜的遊戲。新設計在效能上亦有所提升,以7970為例,32個Compute Unit行925MHz,單精度運算效能(Single Precision Compute Power)達到3790GigaFLOPs/s,比上一代6970 Cayman高得多(2700GigaFLOPS/s),而雙精度運算效能(Double Precision Compute Power)便達到947 GigaFLOPS/s,比6970 Cayman(683 GigaFLOPS/s)提升接近40%;與Cayman一樣,TMU(Texture Mapping Unit)貼住運算部件,每個GCN的Compute Unit都有4個Texture Filter Unit和4x4個Texture Fetch Load/Store Unit,大可以睇成為「4個TMU」。以最高規格的7970 Tahiti XT,內有32個Compute Unit,即一共有128個TMU,比6970(24 x4 = 96個);最後還有16KB(4組,每組64 line,每line 64Byte)的L1 Read/Write Cache,同來暫存Vector Unit的資料。
◆ TeraScale 3的VLIW4結構(左)和GCN的SIMD-16結構比較
◆ GCN Compute Unit方塊圖
◆ 在Fusion時首次公開「GCN」的設計
查詢: AMD: http://www.amd.com


分享分享0 收藏收藏0 讚好讚好0 Unlike!Unlike!0 分享 傳送 邀請
您需要登錄後才可以回帖 登錄 | 馬上註冊 |

Archiver|手機版|SAY討論區

GMT+8, 2024-5-10 17:09 , Processed in 0.724777 second(s), 9 queries .

Powered by go2tutor.comDiscuz! X2

© 2024 Community Networks Limited

回頂部